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(扬州 大 学 信息 工程 学 院 ( 人 工 智 能 学 院 ) ,江苏 扬州 225127) 


摘 要 : [目的 /意义 ] 针对 传统 人 工 识 别 病虫害 存在 的 效率 过 低 、 成 本 过 高 等 问题 ， 提 出 一 种 融合 ECA (Effi- 
cient Channel Attention) 注意 力 机 制 与 DenseNet201 的 水 稻 图 像 识别 模型 GE-DenseNet (G-ECA DenseNet)。 [方法 ] 
首先 在 ECA 机 制 上 引入 Ghost 模块 的 思想 构成 G-ECA Layer 结 构 ， 增 强 其 提取 特征 的 能 力 。 其 次 ， 在 DenseNet201 


原 有 的 Dense Block 前 引入 G-ECA Layer， 使 模型 具有 更 优 的 通道 特征 提取 能 力 。 由 于 实验 所 用 的 数据 集 较 小 ， 将 
DenseNet201 在 ImageNet 数 据 集 上 预 训练 的 权重 参数 迁移 到 GE-DenseNet 中 。 训 练 时 ， 采 用 Focal Loss 函数 来 解决 
各 分 类 样本 不 均衡 的 问题 。 同 时 ， 使 用 Adam 优化 器 以 避免 在 模型 训练 初期 由 于 部 分 权重 随机 初始 化 而 导致 反 向 
传播 的 梯度 变化 剧烈 的 问题 ， 在 一 定 程度 上 削弱 了 网 络 训练 的 不 确定 性 。[ 结 果 和 讨论 ] 在 包含 水 稳 胡 麻 斑 病 、 水 


稻 铁 甲虫 、 稳 瘟病 与 健康 水 稻 的 3355 张 图 像 数 据 集 上 进行 了 实验 测试 ， 识 别 准 确 率 达到 83.52%。 由 GE-DenseNet 
模型 的 消融 对 比 实验 可 得 ， 引 入 了 Focal Loss 函数 与 G-ECA Layer 层 之 后 ， 模 型 准确 率 上 升 2.27%。 将 所 提 模 型 与 


经 典 NasNet (4@1056) 、VGG-16 和 ResNet50 模 型 相 比 ， 分 类 准确 率 分 别提 高 了 6.53%、4.83% 和 3.69%; 相 较 于 
原始 的 DenseNet201， 对 水 稳 铁 甲虫 的 识别 准确 率 提升 达 20.32%。 [结论 ] 加 入 G-ECA Layer 结 构 能 够 使 模型 更 为 
准确 地 捕捉 适合 于 水 稳 病虫害 识别 的 特征 信息 ， 从 而 使 GE-DenseNet 模 型 能 够 实现 对 不 同 水 稻 病虫害 图 像 更 为 准 


确 地 识别 ， 为 及 时 防治 病虫害 ,减少 各 类 损失 提供 技术 支持 。 
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水 稳 作 为 中 国 主要 的 粮食 作物 之 一 ，2022 年 全 
国 种 植 面积 已 达 2945 万 公 硕 ”，。 然 而 ， 病 虫害 对 
水 稳产 量 有 较 大 影响 ， 轻 则 造成 减产 ， 重 则 绝收 。 
因此 ， 如 何 准确 、 高 效 地 识别 水 稳 病 虫害 并 且 及 时 
落实 对 应 的 防治 措施 已 成 为 吸 待 解决 的 问题 。 传 统 
人 工 识 别 病虫害 往往 存在 效率 过 低 、 成 本 过 高 等 问 
题 。 从 图 像 分 类 和 图 像 分 割 ”的 角度 对 稳 叶 图 像 


收 稿 日 期 : 2023-05-07 


进行 处 理 也 都 需要 经 验 丰 富 的 农业 工作 者 或 研究 人 
员 对 图 像 进行 人 工 标注 ,数据 集 制 作 过 程 难 
PEK", 

近年 来 ， 随 着 人 工 智 能 的 快速 发 展 ， 卷 积 神经 
网 络 (Convolutional Neural Networks, CNN) Z 
步 应 用 于 农作物 病虫害 的 识别 。Brahimi 等 ”利用 
AlexNet 将 收集 到 的 番茄 叶片 病害 图 像 分 类 为 9 种 
病害 ， 通 过 可 视 化 的 方法 定位 叶片 中 的 病害 区 域 ， 
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证 明 AlexNet 具 有 较 好 的 识别 效果 。Rahman 4 
对 VGG-16 和 Inception-V3 进行 了 模型 微调 ， 并 提 
出 了 一 种 两 阶段 的 小 型 CNN 架构 ， 在 自 建 的 1426 
张 水 稳 病 害 图 像 的 数据 集中 得 到 了 93.3% 的 平均 准 
确 率 。 李 森 等 “在 AlexNet 和 VGG (Visual Geome- 
try Group) 网 络 模型 的 基础 上 ， 引 入 批 归 一 化 算 
法 ,改善 了 模型 的 过 拟 合 问题 ， 在 由 3 种 黄瓜 病害 
图 像 和 5 种 水 稻 病害 图 像 构 成 的 自制 数据 集 AES- 
IMAGE 上 ,平均 识别 准确 率 分 别 达 到 了 95.93% 和 
95.42%。 Sharma 等 ”引入 一 系列 集合 块 用 以 提取 
深层 特征 ， 同 时 采用 可 分 离 卷 积 来 减 小 计算 量 ， 提 
出 了 DLMC-Net 模 型 ， 在 四 个 公开 的 柑橘 、 黄 瓜 、 
葡萄 和 番茄 的 叶片 数据 集中 ， 平 均 准 确 率 分 别 达到 
93.56%, 92.34%, 99.50% 和 96.56%。 Monu 等 外 
在 VGG-16 模 型 基础 上 ， 引 入 局 部 二 值 特征 进行 融 
合 ， 并 采用 随机 森林 法 分 类 ， 有 效 提升 了 模型 的 鲁 
棒 性 ， 在 公开 的 PlantVillage 甜 株 叶片 数据 集 上 ， 准 
确 率 达 到 99.75%。 王 东方 和 汪 军 ”对 SE-ResNeXt- 
101 模型 进行 改进 ， 结 合 迁 移 学 习 ， 提 出 了 一 种 不 
指定 农作物 种 类 的 病害 分 类 模型 TL-SE-ResNeXt- 
101， 在 重 构 的 AI Challenger 2018 农 作物 病害 数据 
集 上 测试 平均 准确 率 达 到 98%。 

以 上 网 络 模型 通常 只 从 调整 深度 或 宽度 两 方面 
AF, 不 能 有 效 利用 通道 特征 信息 进行 特征 提取 。 
本 研究 针对 水 稻 胡 麻 斑 病 (BrownSpot)、 水 称 铁 甲 
th (Hispa), fe (LeafBlast) 这 3 种 常见 病 虫 
害 识别 问题 ， 通 过 增加 模型 的 通道 特征 表达 能 
提出 了 一 种 融合 高 效 通 道 注意 力 (Efficient Chan- 
nel Attention，ECA) 机 制 与 DenseNet201 的 水 称病 
虫害 识别 方法 。 利 用 该 方法 可 以 有 效 对 水 稻 叶 片 图 
像 进行 分 析 ， 结 合 实时 监测 数据 构建 水 稻 病 虫害 检 
测 与 预警 系统 ， 有 助 于 在 病虫害 发 生 早期 阶段 及 时 
采取 防治 措施 ， 减 少 各 类 损失 。 同 时 ， 收 集 大 量 水 
稻 病 虫害 分 析 数 据 也 可 以 促进 病虫害 研究 与 防治 
术 的 不 断 改进 和 优化 。 


2 实验 材料 


2.1 水 稻 病 虫害 图 像 采 集 


选取 水 稳 胡 有 厅 斑 病 、 水 稳 铁 甲虫 和 稳 瘟 病 这 3 


种 水 稻 常 见 的 病虫害 ， 将 其 与 健康 水 稻 的 叶片 图 像 
构成 数据 集 ， 并 进行 病虫害 图 像 识 别 。 实 验 数据 采 
集 点 为 江苏 省 仪征 市 壮 禾 米 业 专业 合作 社 ， 为 使 数 
据 符 合 实际 应 用 场景 ,采用 SONY DSC-W800 相 机 
每 隔 2 了 手动 从 水 称 顶 部 、 侧 面 等 多 角度 进行 拍摄 ， 
从 而 获取 不 同 光 照 条 件 、 不 同 视角 、 不 同 庶 挡 环境 
下 水 稳 叶 片 的 图 像 1250 张 。 男 外 ， 在 Kaggle 数 据 
库 (https://www. kaggle.com/) 收集 有 关 病 虫害 样 
本 。 数 据 集 总 计 3355 张 图 像 ， 其 中 健康 叶片 1488 
张 ， 水 稻 胡 麻 斑 病 523 张 ， 水 稻 铁甲 虫 565 张 ， 稻 
JI 779 3K 


2.2 水 稳 病 虫害 图 像 预 处 理 


由 于 病虫害 数据 的 原始 特征 较为 接近 ， 本 研究 
首先 按照 9: 1 的 比例 将 数据 集 划 分 成 为 训练 集 与 
测试 集 ， 再 对 训练 集 进行 数据 增强 ""， 从 而 获得 
更 大 的 训练 集 分 配 ， 提 高 网 络 模型 的 泛 化 能 力 ， 防 
止 出 现 过 拟 合 的 情况 。 使 用 随机 选择 一 个 感 兴趣 区 
域 (Region of Interest, ROI) 的 方式 实现 数据 集 样 
本 图 像 局 部 比例 为 1.1~1.25 缩 放 ， 从 而 模拟 实际 拍 
梳 过 程 中 由 于 植物 距离 摄像 尖 远 近 不 同 ， 只 有 部 分 
叶片 被 拍摄 到 的 情况 。 具 体 步 又 包括 : 在 图 像 左 上 
角 20X20 像 素 内 随机 选取 ROI 和 矩形 的 起 始 坐 标点 ， 
再 选取 180~200 之 间 的 任意 数 作 为 ROI 的 边 长 ， 
从 而 形成 一 个 ROI 区 域 。 另 外 ， 使 用 随机 旋转 一 定 
角度 后 进行 裁 切 的 方式 模拟 叶片 不 同 角 度 拍 摄 图 
像 ， 具 体 步 又 包括 : (1) 随机 选取 一 个 旋转 角度 ; 
(2) 针对 图 像 的 中 心 点 和 得 到 的 旋转 角度 生成 相应 
的 仿 射 变换 和 矩阵， 实现 图 像 的 旋转 操作 ; (3) 通过 
选取 最 大 内 接 和 矩形 的 方法 去 除 黑 边 。 

最 终 增强 后 训练 集 大 小 为 18,018 张 ， 不同 尺寸 
的 图 像 统 一 转换 像素 为 224X224X3， 其 中 3 代表 
彩色 图 像 中 RGB 三 个 通道 的 信息 ， 以 便 模 型 训练 ， 
样本 和 集 具 体 构成 如 表 1 所 示 。 

数据 样本 展示 如 图 1 所 示 。 水 称 胡 麻 斑 病 
(图 1 (b) ) 的 显著 特征 是 其 叶片 上 分 布 有 大 小 不 
一 的 椭圆 形 褐色 病 斑 ， 病 斑 边 缘 明 显 并 有 黄色 雷 轿 
环绕 。 而 水 稻 铁 甲虫 (图 1 (c) ) 则 表现 为 叶片 上 
有 形状 、 大 小 各 异 的 被 铁甲 虫 哺 食 后 的 缺口 以 及 幼 
虫 取 食 果肉 后 叶片 表面 呈现 的 枯 和 白色 斑痕 。 稻 瘟病 
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#1 水 稻 病 虫害 数据 集 分 布 表 


Tablel Distribution of rice pest and disease dataset 


数据 集中 样本 特征 分 为 慢性 型 和 白斑 型 这 两 种 症 
IR, 慢性 型 (图 1 (d) ) 具体 表现 为 病 斑 呈 菱形 或 


数据 类 别 增强 后 训练 集 / 幅 测试 集 / 幅 纺锤 形 ， 最 外 层 为 黄色 晕 圈 ， 内 环 为 褐色 ， 中 央 为 
健康 叶片 7968 160 
) ， EHI 见 为 圆 形 或 不 规 见 

pecan ees a 灰白 色 ; 白斑 型 (图 1 (e) ) 表现 为 圆 形 或 不 规则 
水 稻 铁甲 虫 3006 64 形状 的 白色 或 灰白 色 斑 点 。 
JADA r 0 

合计 18,018 352 

(a) 健 康 水 称 b) KASHKA Ce) KASR P 3k (d) bE 8 R (e) É SEAIA 


Al 水 稻 病 虫害 样本 图 像 


Fig. 1 Images of rice pest and disease samples 


3 水 称病 虫害 识别 模型 构建 


为 了 获得 更 丰富 的 特征 信息 ， 本 研究 选用 
DenseNet201 " 模型 作为 基准 网 络 。 为 使 模型 在 获 
取 不 同 层 间 关联 性 的 同时 更 高 效 地 获取 通道 信息 ， 
引入 了 基于 Ghost 思想 改进 的 ECA 模 块 ， 将 其 命名 
为 G-ECA Layer (Ghost-ECA Layer), ， 并 利用 这 一 
结构 优化 DenseNet201 网 络 ， 提 出 了 一 种 融合 注意 


k=w(C 
z w(C) 
Cf / i 
A GAP rs 
of pe —¥ 
H | YY £ 
W \ IXIXC 
\ 
SS, 


力 机 制 与 DenseNet201 的 水 稻 病虫害 识别 方法 GE- 
DenseNet (G-ECA DenseNet) 。 


3.1 G-ECA Layer 的 构建 


本 研究 基于 Ghost 模块 ”的 思想 ， 改 变 了 


ECA 注意 力 机 制 "3 的 设计 ， 提 出 G-ECA Layer 这 
一 结构 。 具 体 设计 如 图 2 所 示 。 


图 2 G-ECA Layer 结 构图 


Fig.2 Structure of G-ECA Layer 


假设 输入 特征 图 的 尺寸 为 HXWXC， 其 中 五 
代表 特征 图 的 高 度 ， 丈 代表 特征 图 的 宽度 ，C 代 表 
特征 图 的 通道 数 。 首 先 使 用 全 局 平均 池 化 (Global 
Average Pooling, GAP) 的 对 其 进行 处 理 ， 将 其 压 
缩 为 1X1XC 的 特征 图 。 随 后 ， 将 压缩 后 的 特征 
图 ， 通 过 卷 积 得 到 大 小 为 1X 1Xk 的 特征 图 。 


卷 积 核 ' 数量 可 以 通过 对 通道 维 数 进 行 非 线 
性 映射 从 而 实现 自 适应 确定 ， 卷 积 核 适 应 函数 定义 
如 公式 (1)。 
log,(C) b 
i Y |od 
其 中 ,Kk 表 示 卷 积 核 的 数量 (只 能 取 奇 数 ); C 


(1) 


k=y(C)= 
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表示 通道 数 ; ”和 2 用 于 改变 通道 数 C 与 卷 积 核 数量 
之 间 的 比例 。 通 过 该 函数 ，G-ECA Layer 结 构 可 以 
实现 : 在 通道 数 较 大 的 层 ， 使 用 较 多 卷 积 核 ， 加 强 
对 输入 通道 特征 信息 的 提取 ; 在 通道 数 较 小 的 层 ， 
使 用 较 少 的 卷 积 核 ， 减 少 跨 通道 交互 从 而 减少 计 
算 量 。 

卷 积 后 得 到 的 大 小 为 1X1XK 的 特征 图 ， 第 一 
部 分 使 用 大 小 为 1 的 卷 积 核 进 行 常规 卷 积 操作 ， 得 
到 本 征 特征 图 Ye R'*'**， 卷 积 运 算 可 以 表示 为 
公式 (2)s 

了 = Xxf'+g (2) 

其 中 ,，* 为 卷 积 运算 的 符号 ; g 为 偏 置 项 ; 
了 "Ee RX*!X1Xx4 代 表 大 小 为 1 的 卷 积 核 ， 其 中 输出 通 
道 数 等 于 输入 通道 数 ， 对 原始 特征 进行 必要 的 特征 
提取 。 

第 二 部 分 则 利用 已 经 生成 的 本 征 特征 图 了 进行 
简单 的 线性 变换 @， 得 到 Ghost 特征 图 ， 如 
公式 (3) 

y,=®(y,) (= 1,..,n) (3) 

其 中 ,yy, 是 Y 中 第 i 个 本 征 特征 图 ; @ 是 对 本 征 
特征 图 进行 的 线性 运算 ; y,' 表 示 第 i 个 原始 特征 图 
经 过 变换 后 的 Ghost 特 征 图 。 

最 后 ， 将 两 部 分 特征 图 通过 拼接 (Concatena- 
tion) 操作 "到 加 ， 得 到 输出 为 1X1X2k 的 特征 
图 。 通 过 1X1 的 卷 积 进行 通道 特征 学 习 ， 得 到 1X 
1XC 的 通道 注意 力 特征 图 。 再 将 该 特征 图 与 原始 
输入 的 HXWXC 的 特征 图 按照 通道 顺序 进行 逐 通 
道 点 乘 操作 ， 从 而 输出 与 原始 输入 特征 图 尺寸 一 致 
的 通道 注意 力 特征 图 。 

G-ECA Layer 结构 ， 采 用 了 Ghost 思想 ， 以 线 
性 变换 代替 卷 积 运算 ,对 通道 特征 进行 高 效 融合 的 
同时 避免 了 学 习 通 道 注意 力 信 息 时 的 维度 减 缩 ， 有 
效 提升 了 识别 准确 率 。 


3.2 GE-DenseNet 模型 构建 


DenseNet201 的 模型 结构 如 图 3 所 示 ， 模 型 整 
体 由 四 个 Dense Block 组 成 ， 并 使 用 Transition Layer 
层 作为 连接 。 

其 中 ，Transition Layer 层 包含 了 一 个 1X1 的 卷 
积 和 2X2 的 平均 池 化 操作 ， 整 合 上 一 个 Dense 


INPUT 
一 ¥ 
Conv.(7 X 7),stride 2 
Max Pool. (3 <3),stride 2 
RENE 
Dense Block 1 He x6 
Transition Layer 1 
Backbone < OEE 5 
Dense Block 2 [一 x12 
Y 
Transition Layer2 
Y 
3 
Dense Block 3 一 | GonvGX3) | x48 
a 
Transition Layer3 
(=e z 
Dense Block 4 上 一 上 X32 
= 
Classification Layer 
Y 
OUTPUT 


图 3 DenseNet201 的 分 层 体系 结构 图 


Fig.3 Layered architecture of DenseNet201 


Block 获 取 的 特征 同时 缩小 上 一 个 Dense Block 输 出 
的 尺寸。 

1X1 和 3X3 卷 积 对 构成 了 Dense Block 的 基本 
组 成 部 分 。 其 不 仅 降低 了 特征 的 维度 ， 同 时 也 增加 
了 网 络 的 非 线 性 度 ， 防 止 模 型 过 拟 合 。 在 
DenseNet201 的 四 个 Dense Block 模块 中 ，1X1 和 
3X3 卷 积 对 的 琶 加 数量 依次 为 6 个 、12 个 、48 个 和 
32 个 ， 甚 释 加 的 具体 构成 方式 如 下 : 

假设 通过 前 馈 网 络 模 型 的 特征 层 x,。， 经 过 一 个 
工 层 的 网 络 模型 。 在 传统 的 卷 积 神经 网 络 中 ， 其 中 
第 i 层 的 非 线 性 变换 记 为 H,(*)， 第 i 层 的 特征 层 输 
出 记 为 x,， 则 有 公式 (4): 

x, = H,(xo) (4) 

为 进一步 优化 信息 的 利用 效率 ，DenseNet 引 入 
Dense Block 模 块 ， 使 得 世 层 的 网 络 模型 中 第 ; 层 的 
输入 与 之 前 所 有 层 的 输出 相关 ， 即 公式 (5): 

x, = H,([xo,x1, ,Xi_1]) (5) 

HP, [xo xi，…，x 是 特征 层 的 拼接 操 
作 ， 即 将 当前 层 之 前 的 所 有 特征 层 输 出 按照 通道 维 
度 登 加 在 一 起 ， 而 非 线性 变换 已 ， 即 上 文中 提 及 的 
1X1 和 3X3 卷 积 对 。 由 于 Dense Block 中 每 一 个 卷 
积 对 之 间 都 存在 特征 向 量 进行 连接 ， 从 而 改善 了 整 
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个 网 络 的 信息 密集 度 和 梯度 传递 的 信息 流 ， 可 以 使 
模型 具有 更 好 的 特征 利用 效率 。 在 进行 梯度 反 向 传 
播 的 计算 时 ， 每 一 层 网 络 都 可 以 接收 到 该 层 后 面 特 
征 层 传递 的 梯度 信息 ， 一 定 程 度 上 减少 了 由 于 网 络 
深度 增加 导致 的 梯度 消失 问题 。 此 外 ， 更 为 密集 的 
连接 在 深度 较 大 的 模型 结构 中 通常 具有 正则 化 效 
应 ， 可 以 有 效 防 止 模型 在 训练 过 程 中 出 现 过 拟 合 
现象 。 

基于 3.1 节 所 述 G-ECA Layer 结 构 ， 本 研究 对 
DenseNet201 进行 了 了 修改。 如 图 3 所 示 ， 
DenseNet201 整体 由 四 个 Dense Block 组 成 ， 使 用 
Transition Layer 结 构 作 为 连接 。 但 是 ， 由 于 原始 的 
Dense Block 只 考虑 到 不 同 层 之 间 的 关联 性 ， 忽 略 
了 图 像 识别 过 程 中 重要 通道 信息 的 提取 ， 一 定 程 度 
上 影响 了 模型 对 水 稻 病 虫害 的 识别 准确 率 。 为 了 优 
化 模型 识别 性 能 ， 本 研究 以 DensNet201 模型 为 基 
础 网 络 ， 在 原 有 的 Dense Block 前 引入 G-ECA Layer 
结构 ， 对 输入 给 Dense Block 的 信息 进行 通道 注意 
力 的 增强 ， 以 达到 进一步 提升 识别 模型 准确 率 的 目 
的 。 所 提出 的 GE-DenseNet 网 络 结构 示意 图 如 图 4 
所 示 。 


INPUT 


Conv.(7 X 7),stride 2 


Max Pool. (3 x 3),stride 2 


G-ECA Layer 


| Cow * 1} x6 
HH Conv GX3) 


Dense Block 1 


Transition Layer 1 


G-ECA Layer 


comix] 


Backbone < Dense Block 2 


Transition Layer2 


G-ECA Layer 


__——|_Conv{1 * 1) 
HH Cony (3 %3) 48 


Dense Block 3 


Transition Layer3 


G-ECA Layer 


——— 
| Conv(l X1) 


Conv{3 *3) 


4 
Dense Block 4 -二 


¥ 
Classification Layer 


OUTPUT 
图 4 GE-DenseNet 的 分 层 体 系 结 构图 


Fig. 4 Layered architecture of GE-DenseNet 


3.3 Focal Loss 损 失 函 数 


传统 网 络 通常 使 用 交叉 彤 损失 函数 (Cross En- 
tropy Loss, CE) 进行 模型 训练 ， 如 公式 (6)。 


_|-log(p) i=l 
CE(p,y) = -log (1 - p) otherwise co 


HF, CE () Amn te LMT A KZG p 代 表 样 
本 的 预测 值 ， 范 围 为 [0，1j; y 代 表 样 本 的 真实 
值 , 为 0 或 1。 

ZEIGT AE R RERE PI ARE AS CMI BY EL 
接 求 和 ， 即 各 个 样本 的 权重 是 一 样 的 。 然 而 ， 由 于 
样本 的 类 别 不 均衡 ， 交 叉 炉 损失 函数 识别 准确 率 难 
以 提升 "”。 针 对 该 问题 ， 本 研究 引入 T Focal 
Loss “代替 交叉 炉 损 失 函 数 ， 具 体 为 公式 (7)。 

FL(p,)= -(1 - p,y log (p.) (7) 

其 中 ，p, 为 某 个 类 别 的 类 别 分 数 ; ”为 聚焦 参 
Bs (1 - p,) 为 调制 系数 。 

根据 公式 (7) 可知 : 首先 ， 当 样本 被 错误 分 
类 时 ， 类 别 分 数 p, 很 小 ，(1 - p,) 接 近 1， 从 而 损失 
不 会 受到 影响 。 而 当 p, 趋 近 于 1 时 ，(1 - p,) 趋 向 于 
0， 这 意味 着 分 类 效果 良好 的 样本 的 权重 会 被 降低 ， 
因此 它们 对 总 体 损失 的 贡献 很 小 。 

其 次 ， 当 y 等 于 0 时 ，Focal Loss 即 等 同 于 交 又 
烂 损失 函数 。 随 着 聚焦 参数 ) 的 增加 ， 调 制 系 数 
(1 - p,) 也 会 增加 。 因 此 ， 通 过 调节 ) 能 够 平滑 地 调 
整 易 分 类 样本 被 降低 权重 的 比例 。 基 于 这 些 参 数 ， 
Focal Loss 即 可 通过 增加 误 分 类 样本 的 重要 性 均衡 
样本 ， 从 而 提升 网 络 的 训练 速度 和 精度 。 


3.4 Adam 优化 器 


Ai i FE FHI (Adaptive Moment Estimation, 
Adam) ' ”是 一 种 自 适 应 动量 的 随机 优化 方法 ， 
它 在 随机 梯度 下 降 方法 (Stochastic Gradient De- 
scent, SGD) 的 基础 上 引入 了 动量 和 自 适 应 学 习 
率 的 思想 ， 用 以 加 速 梯 度 下 降 的 过 程 ， 具 体 如 公 
式 (8) ~ (12) Bra: 


m,=f,m,_,+(1 -f,)g, (8) 
v, = Pw,- + - ba) (9) 
n, = 一 (10) 
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- (11) 


0 = 0,- —— a, (12) 
Ji, +6 

AK (8) 2—-BME (动量) 的 计算 公式 ， 其 
中 ，m, 表 示 第 t 个 训练 批 次 的 动量 ; g, 表 示 第 t 个 训 
练 批 次 的 梯度 。 公 式 (8) 通过 超 参数 B, 控 制 历史 
梯度 的 加 权 平 均 ， 从 而 可 以 得 到 一 个 较为 平滑 的 梯 
度 值 。 公 式 (9) 为 二 阶 矩 的 计算 公式 ， 其 中 ，v 
表示 第 :个 训练 批 次 的 二 阶 矩 估计 ，/p, 超 参数 则 控 
制 历史 梯度 的 平方 和 加 权 平 均 。 公 式 (10) 和 
(11) 中 ， 太 ,入 分 别 为 Bi 与 ,对 m, 与 v 的 偏差 矫 
正 ， 用 于 解决 训练 初期 由 于 历史 数据 较 少 引起 的 偏 
差 。 公 式 (12) 为 网 络 模型 参数 的 更 新 公式 ， 其 中 
0 是 第 :个 训练 批 次 的 参数 ，7 是 模型 训练 的 学 习 率 
(Learning Rate) ，s 是 一 个 很 小 的 常数 。 将 公式 中 的 

1 看 作 一 个 整体 ， 即 表示 通过 历史 梯度 的 平 
sf BRE 
方 和 加 权 平 均 ， 实 现 学 习 率 的 动态 调整 。 

本 研究 使 用 Adam 自 适 应 学 习 率 梯度 下 降 算法 
进行 训练 ， 可 以 避免 在 模型 训练 初期 由 于 部 分 权重 
随机 初始 化 而 导致 反 向 传播 的 梯度 变化 剧烈 的 问 
题 ， 在 一 定 程度 上 削弱 了 网 络 训练 的 不 确定 性 。 


4 结果 比较 与 分 析 


4. 


一 上 人 


实验 环境 搭建 与 模型 训练 


实验 平台 搭载 Intel i9-12900K 处 理 器 ， 内 存 
64 GB， 显 卡 为 NVIDIA RTX A4000， 软 件 环境 为 
Windows10 LTSC 64 位 操作 系统 ， 使 用 Anaconda 虚 
拟 环 境 ， 其 中 Python 版 本 为 3.8.15， 深 度 学 习 框 架 
Tensorflow 版 本 为 2.6.0-GPU、 深 度 学 习 加 速 库 为 
CUDA Toolkit11.3.1 和 cuDNN8.2.1。 

GE-DenseNet 模 型 以 数据 增强 后 的 18,018 张 水 
称病 虫害 图 像 进 行 训练 ，352 张 图 像 进行 测试 。 同 
HF, BI VGG-16' 、ResNet50 °"! 、NasNet (4@ 
1056) ”、DenseNet201 作 为 对 照 组 实验 。 训 练 时 ， 
对 照 组 学 习 率 六 设置 为 10*， 采 用 交叉 焙 损 失 函 数 
All Adam 优化 器 。 在 训练 过 程 中 ，BatchSize 大 小 设 
置 为 32， 和 迭代 次 数 (Epoch) 设置 为 30， 保 存 训练 


集 准确 率 最 高 的 模型 权重 用 于 测试 集 评估 。 
4.2 迁移 学 习 


迁移 学 习 (Transform Learning) 2 是 指 将 已 经 
学 习 过 相关 任务 的 知识 (参数 文件 、 模 型 权重 等 ) 
应 用 于 新 的 相关 任务 中 以 得 到 更 好 训练 效果 的 一 种 
方法 。 

本 研究 的 数据 集 分 布 较为 集中 ， 类 别 较 少 ， 迁 
移 学 习 高 质量 数据 集 预 训练 产生 的 模型 进行 微调 训 
练 可 以 有 效 解 决 过 拟 合 等 问题 。 因 此 ， 在 构建 完成 
GE-DenseNet 后 ， 选 择 利 用 在 ImageNet 数 据 集 上 预 
训练 的 DenseNet201 模 型 权重 对 GE-DenseNet 模 型 
中 与 DenseNet201 模型 结构 类 似 的 部 分 网 络 进行 初 
始 化 ， 使 模型 获得 较为 丰富 的 先 验 知识 ， 再 对 GE- 
DenseNet 模 型 在 自制 数据 集 上 进行 训练 。 评 价 指标 
Macro Avg 了 表示 精确 率 ， 即 样本 中 正确 样本 被 预 
测 正确 占 所 有 被 预测 为 正确 样本 的 比率 ; Macro 
AvgR 表 示 召 回 率 ， 即 样本 中 正确 样本 被 预测 正确 
占 所 有 正确 样本 的 比率 ; Macro Avg 书 为 精确 率 和 
召回 率 的 调和 平均 数 的 ; Acc 表 示 准 确 率 ， 即 判定 
为 正确 的 样本 实际 正确 和 被 判定 为 错误 的 样本 实际 
错误 的 两 类 占 比 。 

如 表 2 所 示 ， 经 过 迁移 学 习 后 的 GE-DenseNet 
模型 在 Acc, Macro Avg P, Macro Avg R 和 Macro 
Avg 书 各 项 评价 指标 上 均 提 升 了 至 少 3%。 由 此 可 
得 ， 迁 移 学 习 应 用 于 本 研究 所 提 模 型 下 能 够 有 效 提 
高 识别 准确 度 ， 增 强 模型 性 能 。 

表 2 GE-DenseNet 模 型 迁移 学 习 前 后 性 能 对 比 


Table 2 Performance comparison of GE-DenseNet model be- 


fore and after migration learning 


Macro Macro Macro 

Model Acc 
Avg P AvgR Avg F, 
GE-DenseNet 0.7983 0.8138 0.7508 0.7755 


GE-DenseNet+ 


: 0.8352 0.8451 0.7992 0.8169 
Transform Learning 


4.3 GE-DenseNet 的 识别 性 能 测试 


为 验证 GE-DenseNet 相 较 于 DenseNet201 的 优 
越 性 ， 在 实验 数据 集 上 将 其 二 者 的 训练 损失 率 和 准 
确 率 进行 比较 ， 具 体 对 比 结果 如 图 5 和 图 6 所 示 。 

从 图 5 可 知 ， 随 着 训练 次 数 的 增加 ，GE- 
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模型 类 型 
一 一 GE-DenseNet 
一 一 DenseNet201 


Epochs 
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模型 类 型 
—— DenseNet201 
一 一 GE-DenseNet 


30 40 50 
Epochs 


图 5 GE-DenseNet 模型 与 DenseNet201 模型 的 损失 率 变化 曲 图 6 GE-DenseNet 模 型 与 DenseNet201 模型 的 准确 率 变 化 曲 


线 图 线 图 
Fig.5 Loss rate variation curves of GE-DenseNet model and Fig.6 Accuracy variation curves of GE-DenseNet model and 
DenseNet201 model DenseNet201 model 
DenseNet 和 DenseNet201 的 损失 率 曲线 均 不 断 下 稳定 性 ， 使 之 具有 更 好 的 识别 效果 。 
降 ， 但 GE-DenseNet 曲 线 下 降 速 度 更 快 ， 这 说 明 其 对 比 图 7 中 每 一 组 的 DenseNet201 处理 结果 和 


具有 更 好 的 学 习 能 力 。 从 图 6 可 知 ， 当 Epoch 为 15 ”GE-DenseNet 处 理 结 果 可 以 发 现 ， 加 入 G-ECA Lay- 
时 ， 使 用 G-ECA Layer 和 Focal Loss 的 网 络 模 型 准 er 结构 后 ， 特 征 更 密集 地 体现 在 病虫害 的 周围 ， 进 
确 率 快速 稳定 ， 而 原始 模型 仍 处 于 准确 率 不 断 上 升 一 步 说 明了 G-ECA Layer 结 构 在 本 人 研究 所 提 模 型 上 


的 过 程 。 实 验证 明 ， 本 研究 所 提 方 法 在 训练 稳定 性 。 ”的 有 效 性 。 
方面 有 效 ， 能 够 加 快 模型 收敛 的 速度 ， 提 高 模型 的 


(m)l-c 


(T)3-c 


JE: 1 为 稳 盖 病 ;2 为 水 稻 铁 甲虫 ;3 为 水 稻 胡 麻 斑 病 ;a 表 示 输 入 图 像 ;jb 为 DenseNet201 处 理 结果 ;c 为 GE-DenseNet 处 理 结果 


图 7 GE-DenseNet 与 DenseNet201 模型 特征 层 可 视 化 结果 对 比 图 


Fig.7 Feature layer visualization results comparison of GE-DenseNet and DenseNet201 model 
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4.4 GE-DenseNet 的 消融 试验 


为 证 明 本 研究 所 提 方 法 中 各 个 模块 的 有 效 性 ， 
设计 以 下 4 种 消融 实验 方法 进行 比较 分 析 : 

(1) 使 用 原始 的 DenseNet201 进行 模型 训练 ; 

(2) 在 (1) 的 基础 上 采用 Focal Loss 损失 
函数 ; 

(3) 在 (1) 的 基础 上 在 每 个 Dense Block 前 引 
A G-ECA Layer 结 构 ; 

(4) Æ (3) 的 基础 上 引入 Focal Loss fh K K 
数 ， 形 成 本 研究 所 提 方 法 。 

上 述 4 种 消融 实验 方法 在 本 研究 使 用 的 水 稻 病 
虫害 数据 集 上 的 识别 结果 如 表 3 所 示 。 


表 3 GE-DenseNet 模 型 消融 试验 结果 
Table3 GE-DenseNet Model ablation test results 


模型 准确 率 上 升 2.27%， 模 型 的 召回 率 和 书 Score 
均 有 较 大 幅度 提升 ， 体 现 了 所 提 模 型 的 有 效 性 。 


4.5 与 经 典 深度 卷 积 神经 网 络 模 型 性 能 对 比 


将 本 研究 所 提 方 法 在 相同 训练 环境 与 相同 梯度 
下 降 函 数 的 条 件 下 ,与 VGG-16、ResNet50、Nas- 
Net (4@1056) DenseNet201 等 经 典 深 度 卷 积 神经 
网 络 进行 性 能 对 比 。 

由 表 4 可 知 ，GE-DenseNet 相 较 于 改进 前 的 
DenseNet201 模型 在 稳 瘟 病 和 健康 水 稻 的 识别 效果 
上 略 有 下 降 ， 但 其 对 水 稳 铁 甲虫 的 识别 准确 率 提升 
达 20.32%， 整 体 识别 准确 率 也 优 于 其 他 模型 。 这 一 
结果 表明 在 DenseNet201 模型 中 加 入 的 G-ECA Lay- 
er 结构 能 够 更 为 准确 地 捕捉 适合 于 该 应 用 场景 的 特 
征 信息 从 而 提高 识别 准确 率 。 


Model Acc Macro AvgP Macro Avg R Macro Avg F, 


DenseNet201 0.8125 0.8354 0.7633 0.7850 
十 

DenseNet201+ 0.8239 0.8379 0.7789 0.8026 

Focal 

DenseNet201+ 

RRR 0.8324 0.8426 0.8047 0.8183 
+ 

DenseNstOlE dgs edsi 0.7992 0.8169 


G-ECA +Focal 


从 方法 (1) 和 方法 (2) 可 知 ， 引 入 Focal 
Loss FRAR PK RUR E Dn HE AE H FY 3 LRI FS PRL 
使 模型 的 准确 率 上 升 1.14%， 从 而 验证 了 Focal Loss 
在 数据 样本 不 均衡 的 情况 下 对 模型 性 能 提升 的 有 效 
性 。 从 方法 (1) 和 方法 (3) 可 知 ， 引 入 G-ECA 
Layer 层 ， 使 模型 的 准确 率 上 升 1.99%， 并 使 得 模型 
的 召回 率 提 升 4.14%， 证 明了 加 入 改进 后 的 注意 力 
机 制 能 够 有 效 利 用 通道 信息 ， 实 现 更 加 准确 地 识 
别 。 进 一 步 比较 方法 (1) 与 方法 (4), 可知 引入 
了 Focal Loss 多 分 类 损失 与 G-ECA Layer 层 之 后 ， 


表 4 水 稻 病 虫害 识别 实验 不 同 模型 各 分 类 预测 准确 率 对 比 
Table 4 Prediction accuracy comparison of different models for 


each classification in rice pest identification experiments 


BrownSpot Hispa LeafBlast Health 


Model Acc Acc Acc Acc aid 
VGG-16 0.8438 0.6875 0.7812 0.8063 0.7869 
ResNet50 0.6875 0.5625 0.8125 0.9313 0.7983 

NasNet(4@1056) 0.7500 0.5156 0.7969 0.8688 0.7699 
DenseNet201 0.7500 0.5156 0.8438 0.9437 0.8125 
GE-DenseNet 0.7500 0.7188 0.7969 0.9313 0.8352 


由 表 5 可 知 ， 本 研究 所 提 模 型 在 各 项 指标 上 都 
优 于 其 他 4 类 经 典 模型 ， 在 Macro Avg R 指 标的 比 
较 中 DenseNet201 小 于 VGG-16 模型 ， 但 GE- 
DenseNet 性 能 优 于 VGG-16， 这 表明 改进 后 的 模型 
在 一 定 程 度 上 提升 了 水 稻 病 虫害 识别 的 效果 。 


表 5 水 稻 病 虫害 识别 实验 不 同 模型 性 能 对 比 


Table 5 Performance comparison of different models for rice pest identification experiments 


Model Acc Macro Avg P Macro Avg R Macro Avg F, Size/MB Calculation Volume/GFLOPs 
VGG-16 0.7869 0.7761 0.7797 0.7747 154.17 30.76 
ResNet50 0.7983 0.8163 0.7484 0.7725 482.02 7.93 
NasNet(4@1056) 0.7699 0.7647 0.7328 0.7429 218.45 1.24 
DenseNet201 0.8125 0.8354 0.7633 0.7850 437.43 8.77 
GE-DenseNet 0.8352 0.8451 0.7992 0.8169 437.68 8.78 
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通过 图 8 可 知 ， 在 训练 初期 DenseNet201 得 
益 于 其 较 强 的 学 习 能 力 ， 识 别 准确 率 增长 最 快 ， 最 
先 达 到 70%。 而 在 迭代 25 次 左右 后 ， 由 于 VGG-16 
模型 结构 较为 简单 ， 模 型 最 先 收敛 ， 识 别 准确 率 为 
78% 左 右 。GE-DenseNet 在 前 40 轮 训练 中 学 习 速 率 
相 较 VGG-16 略 有 还 色 ,但 由 于 加 入 了 注意 力 机 
制 ， 能 够 更 全 面 地 学 习 数 据 集 的 特征 ， 所 以 在 其 他 
模型 趋 于 稳定 的 情况 下 仍 处 于 震荡 向 上 的 阶段 ， 经 
过 50 次 迭代 后 ， 达 到 了 最 优 准 确 率 ， 体 现 了 本 研 
究 所 提 方 法 的 有 效 性 。 


模型 类 型 
VGG-16 
一 一 ResNet-50 
DenseNet201 
NasNet(4@1056) 
一 一 GE-DenseNet 


0 10 20 30 40 50 
Epochs 


图 8 不 同 模型 识别 水 稻 病 虫害 准确 率 变化 曲线 图 
Fig.8 Accuracy variation curves of different models to identify 


rice pests and diseases 
5 & 论 


针对 水 稻 病 虫害 图 像 的 特点 ， 本 研究 提出 了 一 
种 融合 ECA 注意 力 机 制 与 DenseNet201 的 图 像 分 类 
模型 GE-DenseNet， 用 以 识别 水 稳 胡 麻 斑 病 、 水 稳 
铁甲 虫 、 稳 瘟病 和 健康 水 稻 4 类 水 稻 叶 片 图 像 。 
GE-DenseNet 在 DenseNet201 每 个 Dense Block 前 添 
加 利用 Ghost 思想 改进 的 ECA 注意 力 机 制 ， 从 而 将 
更 多 通道 信息 融入 特征 图 中 以 提高 模型 的 准确 率 。 
训练 时 ， 使 用 Focal Loss (0 #26 SC hij eK CL aC VI] 
练 集 样本 不 均衡 的 问题 。 

本 研究 所 提 方 法 在 测试 集 上 准确 率 为 83.52%， 
比 DenseNet201 提高 了 2.27%， 比 经 盟 的 深度 卷 积 
神经 网 络 NasNet (4@1056) 、VGG-16 和 ResNet50 
提高 了 6.53%、4.83% 和 3.69%。 综 上 ，GE-DenseNet 
能 够 提高 网 络 的 特征 提取 能 力 ， 从 而 提高 了 分 类 准 
确 率 。 


但 将 该 模型 投入 实际 应 用 仍 存在 一 些 不 足 之 
处 ， 显 著 表 现 为 模型 所 占 内 存 较 大 不 易于 移动 终端 
和 硬件 平台 的 部 署 。 后 续 将 尝试 通过 知识 蒸馏 、 剪 
枝 等 操作 对 模型 进行 轻 量 化 ， 在 不 显著 降低 识别 准 
确 率 的 前 提 下 ， 减 小 模型 体积 ， 从 而 部 署 于 无 人 
机 、 小 车 和 各 类 分 布 式 图 像 检 测 边 缘 设 备 ， 方 便 农 
户 进行 农田 的 实时 检测 ， 有 效 减少 人 力 成 本 并 提高 
检测 效率 。 


利益 冲突 声明 : 本 研究 不 存在 研究 者 以 及 与 公开 
研究 成 果 有 关 的 利益 冲突 。 
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Abstract: 

[Objective] To address the problems of low efficiency and high cost of traditional manual identification of pests and diseases, im- 
prove the automatic recognition of pests and diseases by introducing advanced technical means, and provide feasible technical solu- 
tions for agricultural pest and disease monitoring and prevention and control, a rice image recognition model GE-DenseNet (G-ECA 
DenseNet) based on improved ECA (Efficient Channel Attention) mechanism with DenseNet201 was proposed. 

[Methods] The leaf images of three pests and diseases, namely, brownspot, hispa, leafblast and healthy rice were selected as experi- 
mental materials. The images were captured at the Zhuanghe Rice Professional Cooperative in Yizheng, Jiangsu Province, and the 
camera was used to manually take pictures from multiple angles such as the top and side of rice every 2 h, thus acquiring 1250 images 
of rice leaves under different lighting conditions, different perspectives, and different shading environments. In addition, samples 
about pests and diseases were collected in the Kaggle database. There were 1488 healthy leaves, 523 images of brownspot, 565 imag- 
es of hispa, and 779 images of leafblast in the dataset. Since the original features of the pest and disease data were relatively close, 
firstly, the dataset was divided into a training set and a test set according to the ratio of 9:1, and then data enhancement was performed 
on the training set. A region of interest (ROI) was randomly selected to achieve a local scale of 1.1 to 1.25 for the sample images of 
the dataset, thus simulating the situation that only part of the leaves were captured in the actual shooting process due to the different 
distance of the plants from the camera. In addition, a random rotation of a certain angle was used to crop the image to simulate the dif- 
ferent angles of the leaves. Finally, the experimental training set contains 18,018 images and the test set contains 352 images. The GE- 
DenseNet model firstly introduces the idea of Ghost module on the ECA attention mechanism to constitute the G-ECA Layer struc- 
ture, which replaces the convolution operation with linear transformation to perform efficient fusion of channel features while avoid- 
ing dimensionality reduction when learning channel attention information and effectively enhancing its ability to extract features. Sec- 
ondly, since the original Dense Block only considered the correlation between different layers and ignores the extraction of important 
channel information in the image recognition process, introducing G-ECA Layer before the original Dense Block of DenseNet201 
gives the model a better channel feature extraction capability and thus improved the recognition accuracy. Due to the small dataset 
used in the experiment, the weight parameters of DenseNet201 pre-trained on the ImageNet dataset were migrated to GE-DenseNet. 
During the training process, the BatchSize size was set to 32, the number of iterations (Epoch) was set to 50, and the Focal Loss func- 
tion was used to solve the problem of unbalanced samples for each classification. Meanwhile, the adaptive moment estimation (Adam) 
optimizer was used to avoid the problem of drastic gradient changes in back propagation due to random initialization of some weights 
at the early stage of model training, which weakened the uncertainty of network training to a certain extent. 

[Results and Discussions] Experimental tests were conducted on a homemade dataset of rice pests and diseases, and the recognition 
accuracy reached 83.52%. Comparing the accuracy change graphs and loss rate change graphs of GE-DenseNet and DenseNet201, it 
could be found that the proposed method in this study was effective in training stability, which could accelerate the speed of model 
convergence and improve the stability of the model, making the network training process more stable. And observing the visualization 
results of GE-DenseNet and DenseNet201 corresponding feature layers, it could be found that the features were more densely reflect- 
ed around the pests and diseases after adding the G-ECA Layer structure. From the ablation comparison experiments of the GE- 
DenseNet model, it could be obtained that the model accuracy increased by 2.27% after the introduction of the Focal Loss function 
with the G-ECA Layer layer. Comparing the proposed model with the classical NasNet (4@1056), VGG-16 and ResNet50 models, the 
classification accuracy increased by 6.53%, 4.83% and 3.69%, respectively. Compared with the original DenseNet201, the recognition 
accuracy of hispa improved 20.32%. 

[Conclusions] The experimental results showed that the addition of G-ECA Layer structure enables the model to more accurately cap- 
ture feature information suitable for rice pest recognition, thus enabling the GE-DenseNet model to achieve more accurate recognition 
of different rice pest images. This provides reliable technical support for timely pest and disease control, reducing crop yield loss and 
pesticide use. Future research can lighten the model and reduce its size without significantly reducing the recognition accuracy, so that 
it can be deployed in UAVs, tractors and various distributed image detection edge devices to facilitate farmers to conduct real-time in- 


spection of farmland and further enhance the intelligence of agricultural production. 
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